Incorporating context and geometry in kernel design for support vector machines Contexte et géométrie pour la conception des noyaux
نویسندگان
چکیده
Kernels are functions designed in order to capture resemblance between data and they are used in a wide range of machine learning techniques including support vector networks (SVMs). In their standard version, commonly used kernels such as the Gaussian, show reasonably good performance in many classification and recognition tasks in computer vision, bio-informatics and text processing. In the particular task of object recognition, the main deficiency of standard kernels, such as the convolution one, resides in the lack in capturing the right geometric structure of objects while also being invariant. This paper introduces a novel framework for designing a new class of kernels, referred to as Context-Dependent (CDK), with the particularity of (i) incorporating the geometric structure and the spatial relationships between image primitives (such as interest points, regions, etc.) while (ii) handling invariance and satisfying the positive definiteness which is necessary in all kernel methods including SVMs. Beside these properties, the outperformance of CDKs with respect to standard context-free kernels, is shown for pattern classification problems on standard databases. Résumé Les noyaux sont des fonctions qui modélisent la ressemblance entre les données et sont utilisés dans plusieurs techniques d’apprentissage telles que les machines à vecteurs de supports (SVMs). Dans leur version standard, les noyaux les plus utilisés fournissent de bonnes performances dans plusieurs taches en classification et reconnaissance, en vision par ordinateurs, en bio-informatique, etc. En reconnaissance d’objet, en particulier, les noyaux classiques ne caractérisent pas suffisamment bien les structures géométriques des objets et c ©2009 Hichem Sahbi, Jean-Yves Audibert and Renaud Keriven. Hichem Sahbi, Jean-Yves Audibert and Renaud Keriven manquent aussi d’invariance. Dans ce rapport, on introduit une nouvelle classe de noyaux dite dépendente du contexte (notée “CDK”) avec la particularité (i) d’inclure la structure géométrique et les relations spatiales entre les primitives des images (points d’intérêts, régions, etc.) (ii) d’être invariante aux transformations géometriques et (iii) de satisfaire la condition de Mercer. Outre les propriétés théoriques du noyau “CDK”, ses performances sont meilleures par rapport aux noyaux classiques et “indépendants du contexte”.
منابع مشابه
Local Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study
Recently, methods based on local image features have shown promise for texture and object recognition tasks. This paper presents a large-scale evaluation of an approach that represents images as distributions (signatures or histograms) of features extracted from a sparse set of keypoint locations and learns a Support Vector Machine classifier with kernels based on two effective measures for com...
متن کاملKernel Basis Pursuit
Estimating a non-uniformly sampled function from a set of learning points is a classical regression problem. Kernel methods have been widely used in this context, but every problem leads to two major tasks: optimizing the kernel and setting the fitness-regularization compromise. This article presents a new method to estimate a function from noisy learning points in the context of RKHS (Reproduc...
متن کاملMéthodes à noyaux appliquées aux textes structurés
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...
متن کاملPlongement incrémental dans un contexte de dissimilarité
RÉSUMÉ. Le domaine de la reconnaissance statistique de formes est basé sur la représentation numérique des objets et peut donc être facilement combiné avec des méthodes d’apprentissage automatique. D’autre part, la reconnaissance structurelle de formes utilise un ensemble limité de méthodes d’apprentissage automatique mais encode une riche description des objets via les chaînes de caractères ou...
متن کاملRôle de la matrice d'information et pondération des composantes dans les noyaux de Fisher pour PLSI
RÉSUMÉ. Des similarités entre documents à base de catégories sémantiques latentes et de noyaux de Fisher ont été proposées pour la première fois il y a dix ans par T. Hofmann dans le contexte du “Probabilistic Latent Semantic Indexing”, puis étendues par Nyffenegger et al. (2006). Le présent article présente une étude approfondie et une révision de ces modèles par (1) une description unifiée et...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2009